import pandas as pd

# 读取Excel文件
file_path = '2023.7.15起每小时数据.xlsx'
df = pd.read_excel(file_path, engine='openpyxl')  # 使用 openpyxl 引擎读取 .xlsx 文件

# 确保时间戳被正确解析
df['时间'] = pd.to_datetime(df['时间'], format='%Y/%m/%d %H:%M:%S', errors='coerce')

# 删除时间戳为空的行
df = df.dropna(subset=['时间'])

# 统计每天进出港总次数
daily_counts = df.groupby(pd.Grouper(key='时间', freq='D')).size().reset_index(name='进出港次数')

# 填补缺失的时间点，确保所有天内都有数据（即使为0）
full_range_daily = pd.date_range(start=daily_counts['时间'].min(), end=daily_counts['时间'].max(), freq='D')
daily_counts = daily_counts.set_index('时间').reindex(full_range_daily).fillna(0).rename_axis('时间').reset_index()

# 将每天统计数据保存为新的Excel文件
output_file_path_daily = '2023_7_15起每天进出港统计.xlsx'
daily_counts.to_excel(output_file_path_daily, index=False, engine='openpyxl')

print(f"每天统计数据已保存至: {output_file_path_daily}")